Google възлага своите надежди на Gemini да прескочи GPT-4

Отне една година, само че Гугъл най-сетне даде координиран отговор на изненадващото предизвикателство за господството си в региона на изкуствения разсъдък, което пристигна с стартирането на ChatGPT.

Тазиседмичното издание на Gemini, семейство от огромни езикови модели, ще му даде по-силна платформа за отвръщане както на OpenAI, компанията зад ChatGPT, по този начин и на Microsoft, която е употребила моделите на OpenAI, с цел да зареди всички свои програмен продукт и облачни услуги тази година.

Въпросът в този момент е дали Gemini може да направи значима разлика в съществуващите услуги на Гугъл — и, може би още по-важно, дали може да се трансформира в основа за нова гама от услуги, които придвижват AI доста по-дълбоко в всекидневието.

С трите „ усета “ на Gemini, оповестени тази седмица, Гугъл най-сетне слага своя отпечатък върху технология, чиито лични откриватели направиха доста за пионерите, само че която ChatGPT на OpenAI придвижи в мейнстрийма. Pro версията, да вземем за пример, е позиционирана непосредствено против GPT-3.5 на OpenAI, моделът зад безплатната версия на ChatGPT и работният кон за доста от първите генеративни AI приложения от други компании, които се появиха на пазара тази година.

По-малкият Gemini Nano се съпоставя със системи като най-малката версия на LLaMa 2, моделът с отворен код на Фейсбук, което го прави кадърен да се извършва на мобилно устройство. Apple, както постоянно, подхваща премислен метод, преди да вкара генеративен AI в iPhone, само че появяването на Gemini в най-новия телефон Pixel на Гугъл е знак, че не може да си разреши да чака прекомерно дълго.

Това е най-хубавият Gemini Ultra, който би трябвало да излезе при започване на идната година, който носи главните очаквания на Гугъл да съвпадне или надскочи GPT-4 на OpenAI в конкуренцията да трансформира генеративния AI в по-полезен всекидневен инструмент. Компанията изостана тази година, само че има някои ясни преимущества, които биха могли да оказват помощ за извеждането на Gemini на огромен пазар през 2024 година

Едното е дистрибуцията. Гугъл сподели тази седмица, да вземем за пример, че Gemini ще бъде прибавен към Chrome, който има повече от 60 % от пазара на браузъри, давайки на милиарди уеб консуматори неотложен достъп до принадлежности, които могат да вършат неща като разбор на наличието на мрежата страници.

Докато Гугъл употребява съществуващата си пазарна мощност по този метод, с цел да ускори своите AI упоритости, регулаторите на конкуренцията ще следят от близко.

Друго преимущество за Гугъл е несигурността към OpenAI. След шоковото уволняване и възобновяване на основния изпълнителен шеф Сам Алтман предишния месец, доста компании, които са построили свои лични генеративни AI проекти върху моделите на OpenAI, ще се стремят да хеджират своите залози.

Компанията за търсене също ще надявайте се, че неговият чатбот Bard ще свърши по-добра работа в съперничеството с ChatGPT в този момент, откакто има по-добър езиков модел зад него. Но най-голямата му вяра да си върне преимуществото може да се крие в това да бъде първият, който предлага идващите революционни услуги, задвижвани от генеративен AI. Някои от декларираните благоприятни условия за Gemini сочат къде Гугъл счита, че може да се крият.

Той направи доста от обстоятелството, че Gemini е планиран през цялото време да бъде „ мултимодален “ – т.е. кадърен да схваща освен текст, само че и изображения, видео и аудио. Според Гугъл това го прави по-подходящ от модели като GPT-4 за справяне с типа на ежедневните обстановки, които разчитат на сетива като зрение и слух.

Това може да е стъпка към AI системи, които са по-способни да работят в действителния свят. Но е прекомерно рано да се каже какви приложения може да направи това допустимо или дали Гугъл в действителност е постигнала техническото предимство, за което твърди.

Друг път за развиване се крие в това, което Гугъл твърди, че са опциите за размишление и обмисляне на Gemini. Това са умения, които биха могли да приготвят почвата за персонални асистенти, способни да се оправят със комплицирани проблеми и да дефинират проект за деяние.

Ако такива асистенти са свързани с други интернет услуги, те също биха могли да станат сътрудници, като подхващат дейности от името на своите консуматори. Представете си да вземем за пример търговски сътрудник, който освен търси мечтаните от вас артикули, само че продължава и заплаща за тях.

Това към този момент се обрисува да бъде една от основните борби за AI през 2024 година и оттатък. OpenAI направи първа стъпка в тази посока предишния месец, когато съобщи, че потребителите му ще могат да построяват обикновени сътрудници върху своите модели, след което да ги оферират за продажба в магазин за приложения на OpenAI. Това може да сочи към идващия огромен AI пробив оттатък ChatGPT – и този път Гугъл няма желание да изостава.

Източник: ft.com